Jina AI 发布 Reader-LM-0.5B 和 Reader-LM-1.5B:为网络数据处理提供多语种、长语境和高效小语言模型,彻底改变 HTML 到 Markdown 的转换方式

JinaAI发布了两个小型语言模型:Reader-LM-0.5B和Reader-LM-1.5B。这两个模型经过专门训练,可以将原始HTML转换为标记符,而且都是多语言模型,支持多达256K字节的上...